伺服器磁碟陣列(RAID)-本機的儲存系統

     伺服器的運作主體是主機硬體層,在自動化的資訊維運理念上是降低人力成本
     提昇維運能力與預警處置的最佳運作模式
     在伺服器的監控設計上有多種偵測項目的功能,"磁碟陣列"就是其中一種
     磁碟陣列系統的監控項目包含有磁碟陣列卡與實體硬碟機的監控
     以自動化檢測輔助傳統的以燈號判斷伺服主機狀態的情況
     資訊維運系統的"磁碟陣列"功能,其偵測目的為即時掌控磁碟陣列卡(RAID)與實體磁碟機之安全指標與設定狀態
     可預警式更換不穩定之磁碟,尤其是屬於虛擬主機的VMhost,則會一次影響多台伺服主機,可見其重要性

     從人工巡視機房轉變為自動化檢測機制後檢查次數提昇100倍

     使用人工的方式每天巡視機房,從燈號看伺服器的硬體狀態,成為系統維護人員的重要工作之一
     其中具代表性的伺服主機重要燈號指標如下:
       *.伺服器主體硬體狀態的燈號指示
       *.伺服器內有主機板的溫度感測器,散熱風扇,電壓電流以及電源供應器等裝置
       *.磁碟陣列(RAID)-磁碟陣列中重要的裝置有磁碟陣列卡與實體硬碟機

     由上述可知磁碟陣列的燈號狀況,一直也是維運管理員在管理磁碟陣列時的一個重要指標
     所以Watchdog資訊維運系統將"磁碟陣列"納入伺服器的維運項目內
     用自動化的檢測系統以拹助IT部門達到最快速與全面性的監控與支援
     當異常事件發生時可以馬上通知維運人員,若使用人工方式將會等到嚴重故障事件發生時才會知道,
     也無法達到預警機制,更沒有數據與訊息的輔助,僅能憑系統人員的經驗或用猜的方法來排除故障,
     尤其是虛擬主機,則會有更大影響,因為多台的Guest主機依附著Host主機並且提供服務
     當異常發生時所產生的資訊災害會比一般的實體主機來的更嚴重.




     上圖為磁碟陣列的圖形監控首層
     由上一段說明可以知道,磁碟陣列的偵測,在伺服主機的管理上占了非常重要的一個環節

     維運系統的"磁碟陣列"功能在設計上是嚴謹而詳細,監測目標包含如下:
       *.磁碟陣列卡與記憶體狀態,電池狀態
       *.磁碟陣區
       *.邏輯磁碟區
       *.實體磁碟機
       *.磁區讀寫錯誤
       *.預警式故障
       *.磁碟重整(Rebuild)
       *.新增磁碟陣列卡/磁碟陣區/邏輯磁碟區/實體磁碟機
       *.移除磁碟陣列卡/磁碟陣區/邏輯磁碟區/實體磁碟機

     磁碟陣列功能可支援多種常用的廠牌,例如下列品牌:
       HP Smart Array
       Adaptec RAID
       LSI MegaRAID
       LSI 3ware RAID (storcli)
      
     進入"磁碟陣列"功能的監控畫面,請由偵測狀態的底下伺服主機點選進入之後,選擇磁碟陣列即可,請參閱下圖:



     "磁碟陣列"功能同時提供各種不同的資訊,協助維運人員管理伺服主機的磁碟陣列
     詳細也可參考系統右上角的使用說明
     監控功能可以支援不同廠牌磁碟陣卡混合使用,同時支援一片以上的磁碟陣列卡與多量的
     陣列區,邏輯磁碟區與硬碟的監控偵測

     下圖為Watchdog系統的磁碟陣列偵測首頁



     可以點選偵測首頁畫面的硬碟查看原始資訊,如下圖直接點選




    


     直接展示出偵測硬碟的原始相關資訊,提供管理員進行分析
    
請由偵測名單->伺服主機->磁碟陣列設定首頁右上角有個紅色問號點進入,即可查看使用說明,內容如下:



    
磁碟陣列
       *.支援不同廠牌磁碟陣卡混合使用
       *.支援數量眾多的磁碟陣列卡、陣列區、邏輯磁碟區與硬碟的偵測

啟用磁碟陣列偵測
       1. 請先安裝磁碟陣卡支援的"CLI命令" (Microsoft Windows版本己預設安裝)
       如:
             HP Smart Array ->hpacucli
             Adaptec RAID ->arcconf
             LSI MegaRAID ->MegaCli
             LSI 3ware RAID ->storcli

       各廠牌伺服器內的常用磁碟陣卡
             HP ->HP Smart Array
             IBM ->Adaptec RAID,LSI MegaRAID,LSI 3ware
             DELL ->LSI MegaRAID,LSI 3ware
             Intel ->LSI 3ware RAID

     磁碟陣列依不同的廠牌對正常與異常有不同的訊息定義
     磁碟陣列廠牌型號 HP Smart Array
     邏輯磁碟區的使用狀態訊息
       正常的訊息
             OK ->很好
      異常的訊息
             Failed Physica Drive ->故障或HD己移除
             Recovering,5%complete ->重建中
             ReadyforRebuild ->己重建

實體磁碟機的使用狀態訊息
       正常的訊息
             OK ->很好
       異常的訊息
             Failed ->故障或己移除

       正常應用狀態的訊息
             Data Drive ->使用中的實體磁碟機
             Spare Drive ->備用的實體磁碟機
             Unassigned Drive ->未定義的實體磁碟機
       異常應用狀態的訊息
             Rebuilding (重建中)

磁碟陣列廠牌型號 Adaptec RAID
邏輯磁碟區的使用狀態訊息
             正常的訊息
             Okay ->可以,不錯,很好
       異常的訊息
             Critical ->危急

實體磁碟機的使用狀態訊息
       正常的訊息
             Online ->使用中的實體磁碟機
             Offline ->未使用的實體磁碟機
             HotSpare ->備用的實體磁碟機
       異常的訊息
             Rebuilding ->重建中
             Defunct ->死的,已移除

磁碟陣列廠牌型號 LSI MegaRAID
邏輯磁碟區的使用狀態訊息
       正常的訊息
             Optimal ->正常
       異常的訊息
             Degraded ->己降級 (可能正在Rebuild中)
             Clearing ->清除(正在做 Rebuilding 首次init RAID)
             Critical ->危急

實體磁碟機的使用狀態訊息
       正常的訊息
             Online ->使用中的實體磁碟機
             HotSpare ->備用的實體磁碟機
             Unconfigured(good) ->未定義->正常
       異常的訊息
             Rebuild ->重建中
             Unconfigured(bad) ->未定義->故障

磁碟陣列廠牌型號 LSI 3ware RAID (storcli)
邏輯磁碟區的使用狀態訊息

       正常的訊息
             Onln ->正常
       異常的訊息
             Dgrd ->Degraded 己降級 (可能正在Rebuild中)
             Rbld ->Rebuild 重建中

實體磁碟機的使用狀態訊息
       正常的訊息
             Onln ->Online 使用中的實體磁碟機
             GHS ->Global Hotspare 備用的實體磁碟機(共用)
             DHS ->Dedicated Hot Spare 備用的實體磁碟機(專用)
             UGood ->Unconfigured Good ->未定義->正常
       異常的訊息
             Offln ->Offline 離線中的實體磁碟機
             Rbld ->Rebuild 重建中
             UBad ->Unconfigured Bad ->未定義->故障

       storcli 專用名稱說明

       DG/VD 邏輯磁碟區的使用狀態訊息
             DG=Disk Group Index
             Arr=Array Index
             Row=Row Index
             EID=Enclosure Device ID
             DID=Device ID
             Type=Drive Type
             Onln=Online
             Rbld=Rebuild
             Dgrd=Degraded
             Pdgd=Partially degraded
             Offln=Offline
             BT=Background Task Active
             PDC=PD Cache
             PI=Protection Info
             SED=Self Encrypting Drive
             Frgn=Foreign
             DS3=Dimmer Switch 3
             Dflt=Default
             Msng=Missing
             FSpace=Free Space Present

       PD/HD 實體磁碟機的使用狀態訊息
             EID=Enclosure Device ID
             Slt=Slot No.
             DID=Device ID
             DG=DriveGroup
             DHS=Dedicated Hot Spare
             UGood=Unconfigured Good
             GHS=Global Hotspare
             UBad=Unconfigured Bad
             Onln=Online
             Offln=Offline
             Intf=Interface
             Med=Media Type
             SED=Self Encryptive Drive
             PI=Protection Info
             SeSz=Sector Size
             Sp=Spun
             U=Up
             D=Down
             T=Transition
             F=Foreign UGUnsp=Unsupported
             UGShld=UnConfigured shielded
             HSPShld=Hotspare shielded
             CFShld=Configured shielded|
             Cpybck=CopyBack|
             CBShld=Copyback Shielded

     與原廠的資訊狀態同步是維運系統資訊取得重要的指標

     磁碟陣列的狀態訊息是使用原廠所提供的CLI命令取得,以確保資料狀態的準確性



       週邊項目的設定如下:
       *.磁碟陣列
       *.標記本機無磁碟陣列
       *.磁碟陣列-CLI命令
       *.邏輯磁碟區掛載
       *.實體磁碟安裝記錄

     其中的第一項標記本機無磁碟陣列功能,為選擇開啟與關閉的開關式選項
     在初始安裝Watchdog系統的代理程式時為開啟之狀態,如果被偵測目標主機不需要此偵測功能
     可點選要關閉之按鈕進行關閉的動作,本功能設計的原因是當確認伺服主機本身沒有磁碟陣列時,
     可使用本功能進行關閉以減少主機資源的浪費

     如下圖選擇RAID卡廠牌之後點選啟用,如此在磁碟陣列的偵測項目,連結才會取的到資訊:



     在RAID卡廠牌的選項中,有如下的選擇:
       *.HP Smart Array
       *.HP Smart Array 64bit
       *.Adaptec RAID
       *.Adaptec RAID 64bit
       *.LSI MegaRAID
       *.LSI MegaRAID 64bit
       *.LSI 3ware/MegaRAID
       *.LSI 3ware/MegaRAID 64bit

     如要啟用磁碟陣列偵測功能,請務必選擇對應的廠牌,並點選儲存即可點選到磁碟陣列偵測功能設定主畫面進設定

     在選擇主畫面設定的右上角,有個紅色問號,可以點選進入參考使用方式:


     以下為使用說明的內容,請詳細閱讀與參考:

     磁碟陣列會因伺服器廠牌,型號而安裝不同的磁碟陣列卡
     不同的磁碟陣列卡會用原廠所屬的CLI命令(command line)來取得磁碟狀態
       如:
       HP -> hpacucli (HP Smart Array)
       IBM -> arcconf (Adaptec RAID)
       DELL -> megacli (LSI MegaRAID)

     磁碟陣列卡廠牌可多選
     . Unix,Linux,FreeBSD ...等系統
       程式路徑(PATH)若是在 /usr/bin,/usr/sbin,/bin/sbin 預定之執行路徑(set PATH)內可不用輸入
       非系統預定執行路徑 例如:/usr/local/bin

     . Microsoft Windows 系統
       程式路徑(PATH)若是在 \WINDOWS\system32 ..等 預定之執行路徑(set PATH)內可不用輸入
       非系統預定執行路徑 例如:c:\msutl

     邏輯磁碟區掛載與實體磁碟安裝記錄
     本項次為邏輯磁碟區掛載的偵測畫面,點選進入即可進入,如下圖:



     本項次為實體磁碟安裝記錄的偵測畫面,點選進入即可進入,如下圖:



     邏輯磁碟區掛載與實體磁碟安裝記錄
     這兩項選項的設計目的,就是提供維運管理者在使用磁碟陣列偵測功能時,另一個詳細的數據連結
     提供以下的項次給維運管理者參考與使用.

     邏輯磁碟區掛載
       *.CLI名稱
       *.陣列卡號
       *.廠牌型號
       *.硬碟編號
       *.硬碟介面
       *.硬碟型號
       *.硬碟容量
       *.應用狀態
       *.使用狀態
       *.掛載位置(/home2)
       *.驅動位置(/dev/cciss/c0d2)

     實體磁碟安裝記錄
       *.CLI名稱
       *.陣列卡號
       *.廠牌型號
       *.硬碟編號
       *.硬碟介面
       *.硬碟型號
       *.硬碟容量
       *.應用狀態
       *.使用狀態
       *.硬碟安裝時間yyyy/mm/dd
       *.保固年限


回到首頁